纯视觉VLA方案从有限数据中学到强大的空间泛化能力
设想一下刚学开车的情况:在训练场上,我们可能会反复练习特定动作:到了某个位置就踩刹车,拐到某个点就打方向盘。久而久之,这些动作会形成 “条件记忆”,一旦环境发生变化,就容易手忙脚乱。最近,千寻智能的研究人员注意到,基于模仿学习的视觉运动策略中也存在类似现象,并
设想一下刚学开车的情况:在训练场上,我们可能会反复练习特定动作:到了某个位置就踩刹车,拐到某个点就打方向盘。久而久之,这些动作会形成 “条件记忆”,一旦环境发生变化,就容易手忙脚乱。最近,千寻智能的研究人员注意到,基于模仿学习的视觉运动策略中也存在类似现象,并
倒计时1天!中秋遇国庆的超级长假,出游预订已进入白热化阶段。机票酒店手慢无、热门景区门票秒罄背后,藏着游客最真实的焦虑——不想再 “走马观花拍打卡照”,更怕 “白天挤破头、晚上没的玩”,满心期待的长假,最后变成 “花钱买累受”!
你给它一道题,它可能很快能找到一个能拿高分的解法。然后,它就会把这个解法焊在脑子里,以后碰到所有类似的题,翻来覆去就是这一招。这种现象,行话叫“模式崩溃”(mode collapse)。
上周陪我妈去协和复查,排在前面的老大爷被AI打了个“低风险”,结果主治医生瞄了一眼报告,直接加做增强CT,真揪出一个早期小病灶。
随着多模态大语言模型(MLLMs)在视觉问答、图像描述等任务中的广泛应用,其推理能力尤其是数学几何问题的解决能力,逐渐成为研究热点。
他们给出了一个简洁却颠覆性的解释:大模型之所以出现幻觉,并非由于模型架构的失灵,而是当前技术社区的训练与评测机制倾向于奖励猜测,并且惩罚承认不确定的行为,迫使模型在高度不确定时,也倾向猜测性作答以博取准确率分数。
8月27-28日我们组织了2025年秋季策略会,在人形机器人论坛上讨论了机器人的“Scaling Law”时刻、本体在工业场景落地的应用前景和解决方案、以及机器人开放平台的必要性。
人形机器人 scaling 泛化 scalinglaw he 2025-09-03 07:30 4
GPT-4 可能是有史以来最令人印象深刻的统计模型。但如果我告诉你它实际上并不“智能”呢?它只是一个强化版的马尔可夫链。
llm transformer 泛化 马尔可夫链 马尔科夫链 2025-09-01 07:58 3
这项由剑桥大学的李卓恒、Toma Marinov、Adel Bibi、Bernhard Scholkopf和Jure Leskovec共同完成的研究发表于2024年,论文详细探讨了在神经网络中如何涌现思维链推理能力。有兴趣深入了解的读者可以在相关学术平台找到这
推理 transformer 神经网络 剑桥大学 泛化 2025-08-30 14:54 5
随着全球化及数字化浪潮的深度渗透,用户娱乐互动及内容消费方式正发生结构性迁移。线上化、交互化与沉浸式体验正在重塑全球文化产业价值链条,多元内容场景及玩法创新需求的持续裂变正驱动泛娱乐产业在高速演进中不断细分泛化。与此同时,AI等新兴技术赋能正加速业态边界融合,
国家知识产权局信息显示,北京湃氪斯科技有限公司申请一项名为“基于图卷积层通用原子间势能模型的原子特征更新方法”的专利,公开号CN120473016A,申请日期为2025年05月。
人头攒动的2025WRC(世界机器人大会)上,不乏各种酷炫的Demo展示,可在一众敲锣打鼓的机器人表演中,具身智能公司星海图展位上,机器人却在安静地执行铺床任务。
本文一作为陈骁,香港中文大学 MMLab - 上海人工智能实验室具身智能中心联培博士生,研究方向是三维计算机视觉和具身智能,导师为薛天帆教授。个人主页:xiao-chen.tech/。
这项由上海交通大学的陈思霖、顾晓东等研究人员与华为、UC圣地亚哥等机构合作完成的研究发表于2025年7月,论文标题为"SWE-Exp: Experience-Driven Software Issue Resolution"。有兴趣深入了解的读者可以通过Git
近年来,随着人工智能从感知智能向决策智能演进, 世界模型 (World Models) 逐渐成为机器人领域的重要研究方向。世界模型旨在让智能体对环境进行建模并预测未来状态,从而实现更高效的规划与决策。
模型 机器人 几何 泛化 robotransfer 2025-06-26 14:10 11
在全球自动驾驶领域,一项公认的技术挑战是:如何从每日产生的海量、高度冗余的数据中,快速定位并提取出那些对提升系统安全与体验至关重要的特殊驾驶场景。这些关键场景的有效利用,是改进路径规划和决策算法的核心。
随着 AI4Science 的浪潮席卷科研各领域,如何将强大的人工智能模型真正用于分析科学数据、构建数学模型、发现科学规律,正成为该领域亟待突破的关键问题。近日,中国科学院自动化研究所的研究人员提出了一种创新性框架 ——DrSR (Dual Reasoning
国家知识产权局信息显示,万得信息技术股份有限公司申请一项名为“基于金融领域大语言模型的命名实体识别智能验证与修正方法”的专利,公开号CN120146052A,申请日期为2025年03月。
通过向输入数据添加细微且难以察觉的扰动来诱使机器学习模型产生错误输出的数据点。这些样本常用于测试模型的安全性和鲁棒性。
近日,由杜克大学的周宇发、上海交通大学EPIC实验室的王少博、董星宇、金相奇、陈怡方、闵越,阿里巴巴集团钱团队的杨可欣、任兴章、刘岱恒,以及上海交通大学的张临风等学者共同合作的一项重要研究,于2025年5月31日发表在arXiv预印本平台(arXiv:2506